首页> 外文OA文献 >Semi-supervised Clustering for Short Text via Deep Representation Learning
【2h】

Semi-supervised Clustering for Short Text via Deep Representation Learning

机译:基于深度表示的短文本半监督聚类   学习

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

In this work, we propose a semi-supervised method for short text clustering,where we represent texts as distributed vectors with neural networks, and use asmall amount of labeled data to specify our intention for clustering. We designa novel objective to combine the representation learning process and thek-means clustering process together, and optimize the objective with bothlabeled data and unlabeled data iteratively until convergence through threesteps: (1) assign each short text to its nearest centroid based on itsrepresentation from the current neural networks; (2) re-estimate the clustercentroids based on cluster assignments from step (1); (3) update neuralnetworks according to the objective by keeping centroids and clusterassignments fixed. Experimental results on four datasets show that our methodworks significantly better than several other text clustering methods.
机译:在这项工作中,我们提出了一种用于短文本聚类的半监督方法,该方法将文本表示为具有神经网络的分布式矢量,并使用少量标记数据来指定我们的聚类意图。我们设计了一个新颖的目标,将表示学习过程和thek-means聚类过程结合在一起,并通过标记数据和未标记数据对目标进行迭代优化,直到通过三个步骤实现收敛:(1)根据每个短文本的表示形式,将每个短文本分配给与其最近的质心当前的神经网络; (2)根据步骤(1)中的聚类分配重新估计聚类质心; (3)通过保持质心和聚类分配固定,根据目标更新神经网络。在四个数据集上的实验结果表明,我们的方法比其他几种文本聚类方法的效果明显更好。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号